СВОЙСТВА ПОКАЗАТЕЛЕЙ БЕЗОТКАЗНОСТИ ПОСЛЕ КОРРЕКТИРОВКИ
Для описания свойств оценок достаточно выяснить, насколько они состоятельны, эффективны и несмещенны [31]. В общем случае такая проверка может быть выполнена как аналитически, так и статистически. Аналитический анализ свойств оценок переходных вероятностей, полученных при использовании алгоритмов математического программирования особенно с ограничениями, затруднителен [40]. Более целесообразным путем является статистическое м»
шлпрование, хотя и в этом случае достаточно полная и подробная прпнсрка требует весьма обширных вычислений. Поэтому ограничимся изложением качественных свойств оценок и приведем неко — |1>рыс результаты моделирования, которые будут иллюстрировать характер таких оценок.
Остановимся прежде всего на состоятельности получающихся опенок. При использовании метода максимума правдоподобия (ЛМП) оценки вероятностей переходов являются состоятельными, і с мри увеличении объема выборки они сходятся по вероятности к пішім истинным значениям [53]. В [40] указывается, что в случае вычисления оценок по методу наименьших квадратов также обеспечивается их состоятельность.
Оценки, получаемые с помощью алгоритма квадратичного программирования (АКП), занимают с точки зрения вида используе — мnii информации промежуточное положение. На основе этого мож — ІІП предполагать, что они также обладают свойством состоятельно- » пі В самом деле, пусть, для момента t методом максимума правді июдобия определена матрица оценок стационарных вероятностей перехода (рц’)- Если увеличивать объем реализаций т для получения таких оценок, то при т—> oolim (р’и)=(рц) [90]. Однако при
т-*~°о
ним векторы Яi(t) И Яз(£-г1) также сходятся к одному и тому же с і лцпонарному распределению и (6.16) строго выполняется. Это
0 111. іч ает, что все невязки равны нулю, и, следовательно, решением шц.’ічн квадратичного программирования являются истинные значения вероятностей переходов. Тем самым доказывается состоятель — 1вїсть оценок, получаемых на основе алгоритма (6.19) —(6.20).
Рассматривая эффективность и смещенность оценок {pij), сле — /1 с і отметить, что для их формирования используется менее полили информация, чем при методе максимума правдоподобия. Помом у, если возможно применение алгоритма квадратичного про-
1 рлммпрования и метода максимума правдоподобия, то последний оосснечит более эффективные оценки. Это вытекает из неравенства
11. і о Крамера для границы дисперсии, в соответствии с которым ив версия обратно пропорциональна количеству информации, со — и-рълщейся в выборке. Поэтому эффективность метода (и получающихся оценок) целесообразно оценивать вообще и особенно в си — ivлини, когда при воздействии внешних факторов техническое сос — і’іяпне АС изменяется, а метод максимума правдоподобия непри — МПІНМ. В этом случае задача сводится к получению ответа на вопрос, какие оценки в моменты 6hs s> 1 лучше — полученные в мо — м< їм //( (т. е. {pij)) или их скорректированные значения (рц)?
И H1CCTHO [31], что при оценивании любого параметра 6, 0^6^
I, никакая статистика, распределение которой сосредоточено на пнн рнале (0, 1), не будет несмещенной, так как для 6 = 0 ее мате — маміческое ожидание превосходит 0 (за исключением тривиальных с лучаен вырождения). С помощью алгоритма квадратичного программирования оцениваются параметры, удовлетворяющие именно пому случаю. Поэтому следует ожидать смещения оценок вероятностей переходов, особенно при рц=0. Отмеченное обстоятельство подтверждается результатами оценивания по методу наименьших квадратов с ограничениями і[40]. В этом случае все средние значения оценок рц, соответствующие нулевым элементам Ра, больше нуля. При моделировании около 60% всех полученных для таких Ра оценок точно совпадали с истинными (т. е. нулевыми) значениями, а модули остальных оценок были невелики. Эти данные служат косвенным доказательством того, что в среднем возникающее смещение будет не очень большим.
Несмещенность и эффективность не обязательно анализировать раздельно, так как обе характеристики описывают отклонение оценок от истинных значений, а основная задача алгоритма квадратичного программирования как раз и состоит в том, чтобы такое отклонение минимизировать. Один из удобных критериев в этом случае — минимум среднего квадрата ошибки. В геометрическом смысле этот подход связан с построением и оценкой «расстояния», отделяющего получающуюся оценку от истинного значения. Чем меньше такое «расстояние», тем качественнее оценка. В общем случае минимизация среднего квадрата ошибки дает результаты, отличающиеся от тех, которые получаются при минимизации дисперсии.
Вследствие того, что в рассматриваемом случае необходимо оценить расстояние не между отдельными оценками, а между совокупностью оценок (матрицей вероятностей переходов), определим это «расстояние» следующим образом:
і-І7-1 _
где рц — оценка, получаемая по алгоритму (6.19)—(6.20); pij — истинное значение элемента МБП.
Очевидно, в силу случайности оценок (рц) величина R2 также будет случайной. Для получения более устойчивого значения целесообразно усреднить ее по множеству реализаций:
2 І 2да-Л/)а. (6.25)
* 5=1 1 = 1 7=1
где S — ЧИСЛО повторных вычислений оценок Pi).
Будем использовать эту величину в качестве меры эффективности получающихся оценок. Следует подчеркнуть, что хотя по внешнему виду Л2 напоминает выражение для дисперсии в многомерном случае, таковым оно не является вследствие смещения в оценках
Pij относительно pij.
При статистическом моделировании меру (6.25) можно получить следующим образом.
Зададим некоторую матрицу вероятностей переходов Qi = ||<7гД|, значения элементов которой точно известны. Будем считать ее истинной и искать отклонения именно относительно матрицы ||<7ІЗ-1|. Сформируем на основе матрицы Qi множество реализаций,.
описывающих поведение процесса во времени. По этим реализациям, используя методы максимума правдоподобия и квадратичного программирования, получим оценки, которые обозначим соответственно (qf{tk)) и (?/f(4))> k=,…,k, s=l, Подставляя
найденные значения в (6.25), получим Л2 (4) и Л2 (4), сопоставление которых позволит сравнить эффективность этих методов и выявить характер зависимости получаемых оценок от объема информации (например, по мере увеличения номера k).
Сравнение проведем для следующих случаев.
I. Для всех моментов времени 4, k=l, К накапливается информация, достаточная для применения методов максимума правдоподобия и квадратичного программирования. При этом количество реализаций т для всех моментов одинаково.
II. Для моментов времени 4, k=2,…, К информация накапливается только в виде безусловного распределения значений параметров по состояниям цепи Маркова, причем общее количество реализаций для любого 4 меньше, чем в момент k(m2(th)<Zmi(ti)).
Для обоих случаев предполагается, что техническое состояние но времени описывается одной и той же матрицей вероятностей переходов.
III. В некоторый момент th(k>l) произошло существенное изменение технического состояния АС, что привело к изменению значений элементов истинной матрицы вероятностей переходов. Для всех 4, k~>2 информация накапливается только в виде безусловных распределений по состояниям цепи Маркова.
Случай I введен для того, чтобы сравнить качество оценок, получаемых по методу максимума правдоподобия и методу квадратичного программирования. Случай II позволяет ответить на следующие вопросы: какая оценка (6.25) лучше в моменты tKV k — 2,…, К — получаемая в момент 4 и используемая далее без корректировки или получаемая с учетом коррекции по алгоритму § 6.3; как изменяется величина (6.25) по мере проведения последующих корректировок?
Для описания реальных ситуаций второй случай более пригоден, чем первый (например, если система диагностирования АС определяет принадлежность значения обобщенного параметра к части поля допуска). Кроме того, на местах эксплуатации объем информации может быть меньше, так как диагностируется только часть АС, а не вся партия, выпущенная заводом-изготовителем. Наиболее близок к реальной ситуации III случай, так как он позволяет учесть условия эксплуатации на местах, возможные доработки, при которых исходной информации о техническом состоянии в виде реализаций ОП нет и т. п. Поэтому при анализе этого случая можно ответить на вопросы—насколько существенна первая коррекция и как в результате последующих коррекций изменяется величина (6.25). Иными словами, возможно оценить, как отслеживает алгоритм квадратичного программирования изменение технического состояния АС.
Моделирование производится по следующей методике.
Для всех случаев при заданной матрице вероятностей переходов реализации моделируются по стандартной методике [29], при этом начальное состояние для случая I определяется на основе финального вектора, представляющего собой строку матрицы финальных вероятностей Qj^limQ4, а число реализаций равно т.
Для случая II до момента k—1 используется число реализаций Ш, а начиная с некоторого k количество реализации т2, по которым строятся оценки безусловного распределения, сокращается (m2<mi).
В случае III до момента k—1 элементы матрицы оцениваются по методу максимального правдоподобия, причем реализации строятся на основе опорной матрицы Q. Затем опорная матрица изменяется, и в моменты k,…, К безусловные распределения строятся по значениям, полученным при моделировании матрицы Qz¥=Qi — Эти безусловные распределения используются в алгоритме квадратичного программирования для корректировки значений переходных вероятностей. МатрицыСД и Q2 имеют вид:
Исходные данные следующие: для варианта I т=200; для варианта II mi = 100, m2=60, £ц = 3; для варианта III mi = 200; m2 = =200, ki = 3. Во всех вариантах К=7, а число повторных циклов моделирования — 14.
Обобщенные результаты расчетов величины R2 приводятся в табл. 6.1, где прочерки означают, что алгоритм нс использовался, а знак X — использовать было невозможно.
Из табл. 6.1 видно, что оценки элементов матрицы переходных вероятностей, полученные методом максимума правдоподобия при всех tk эффективнее оценок, найденных на основе АКП (вариант I). Это подтверждает сделанное ранее замечание о том, что всегда, когда возможно, для получения оценок должен использоваться ММП. Из анализа данных варианта II следует, что использование АКП позволяет повысить эффективность (в смысле R2) оценок по сравнению с оценками, полученными ММП, но на более ранних стадиях. Наконец, данные варианта III позволяют сделать вывод, что АКП достаточно эффективно отслеживает изменение технического состояния АС. Так, после первой же корректировки величина R2 уменьшилась более чем в 3 раза.
Таким образом, по мере появления дополнительной информации и ее учета с помощью АКП качество оценок вероятностей переходов улучшается, что подтверждает их состоятельность. Однако следует отметить, что скорость. уменьшения R2 после второй и последующих корректировок не очень велика.
П. фиант |
Алгоритм |
k |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
і |
ММП |
0,0622 |
0,0288 |
0,0158 |
0,0139 |
0,0112 |
0,0102 |
0,0093 |
АКП |
— |
0,0492 |
0,0464 |
0,0446 |
0,0436 |
0,0427 |
0,0417 |
|
к |
ММП |
0,1390 |
0,0631 |
X |
X |
X |
X |
X |
АКП |
— |
— |
0,0538 |
0,0529 |
0,0520 |
0,0511 |
0,0502 |
|
in |
ММП |
0,0622 |
0,0288 |
0,4650 |
X |
X |
X |
X |
АКП |
— |
0,1485 |
0,1392 |
0,1300 |
0,1208 |
0,1115 |
Из сравнения величин Л2 при К=7 для вариантов I и III следу — ■ і, что значения вероятностей переходов, относительно которых производится корректировка, существенно влияют на конечный ре — іулмат. Так, при матрице, более близкой к истинному значению, величина Д2 после ряда корректировок оказывается меньше (вариант I).
15 целом алгоритм квадратичного программирования эффективен корректирует значение МВП, особенно при существенном изменении технического состояния.